Skip to main content

5.4.3 Cluster- og robust-estimering

Opsjonene robust og cluster() brukes hver for seg til å spesifisere om en ønsker hhv. robust- eller cluster-estimering, og vil som resultat presentere regresjonsestimater med justerte standardavvik for de estimerte koeffisienter. Også tilhørende t-, z- og p-verdier påvirkes. Øvrige verdier påvirkes ikke sammenliknet med standard estimering.

Merk at robust og cluster ikke kan benyttes i kombinasjon (cluster impliserer robust estimering).

Robust estimering kan brukes der det er mistanke om problematiske "outliers" eller heteroskedastisitet.

Cluster-estimering brukes når en mistenker at det er systematiske avhengigheter innen grupper av observasjoner, f.eks. innen skoler eller kommuner. Gruppene spesifiseres gjennom en variabel (cluster-variabel) som inngår i parentesen til cluster-opsjonen, f.eks. cluster(skole) eller cluster(kommune). Følgende forutsetninger gjelder, hvis ikke vil systemet gi en feilmelding:

  • Antallet grupper må være av en viss størrelse

  • Clustervariabelen må være numerisk

  • Clustervariabelen kan ikke inngå som variabel i regresjonsuttrykket


Eksempler:

regress inntekt mann gift høy_utdanning, robust

regress inntekt mann gift høy_utdanning, cluster(kommune)

Robust- og cluster-opsjoner kan benyttes også på øvrige regresjonstyper.